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(57) Abstract: The inventive method for 
estimating the relevance of a document with 
respect to a concept consists in calculating 
a relevance function thereof with respect to 
said document on the base of the knowledge 
of a predetermined semantic neighbourhood 
of the concept. Said method also involves 
the calculation (42) of an ambiguity function 
of said concept in the document, which is 
distinct from the relevance function, said 
calculation being estimated in relation with 
different meanings of the concept in said 
document. The method is a successor of 
a preceding step for detecting ambiguous 
concepts in a knowledge base. 

(57) Abrege : Ce precede" d' estimation de 
la pertinence d'un document par rapport a 
un concept comprend le calcul (32) d'une 
fonction de la pertinence du concept par 
rapport a ce document s'appuyanl sur la 
connaissance d'un voisinage semantique 
predetermine de ce concept n comporte 
en outre le calcul (42) d'une fonction 
d'ambiguTte de ce concept dans ce document, 
distincte de la fonction de pertinence, ce 
calcul 6tant estime a partir de la presence 
dans le document de differents sens de ce concept Ce procexie* fait suite a une etape prealable de detection des concepts ambigus 
dans une base de connaissances. 
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Procede d'estimation de la pertinence d'un document par rapport k un concept 

La presente invention concerne un procede d'estimation de la pertinence d'un 
document par rapport k un concept. 
5 Un procede classique d'estimation de la pertinence d'un document par rapport a un 

concept comprend le calcul d'une fonction de pertinence du concept par rapport k ce 
document s'appuyant sur la connaissance d'un voisinage semantique predetermine de ce 
concept. 

On appelle voisinage semantique d'un concept, un ensemble de concepts relies k 
1 0 ce concept par differents liens semantiques dans une base de connaissances. 

En general, lorsqu'on calcule la pertinence d'un document par rapport k un concept, 
la fonction calculee prend en compte dans son estimation la presence dans le document 
du concept lui-meme, ainsi que celle de tous les concepts appartenant k son voisinage 
semantique* 

15 Par consequent, le resultat d'une requete d'estimation d'un document par rapport a 

un concept peut etre errone lorsque ce concept est ambigu, c'est a dire lorsqu'il comporte 
plusieurs sens distincts. En effet, dans ce cas, le voisinage semantique du concept 
comporte des concepts voisins de sens differents de ce concept. 

Cette ambiguite est parfois prise en compte dans le calcul de ia fonction de 

20 pertinence, en reduisant le resultat obtenu par Testimation de la presence du concept pris 
dans un sens predetermine par un resultat obtenu par I'estimation de la presence de 
concepts pris dans un sens different. Ainsi, par exemple, un document dans lequel la 
presence de concepts pris dans un sens different est sup6rieure k la presence de 
concepts pris dans le sens predetermine n'est plus considere comme etant pertinent par 

25 rapport au concept. 

Ce type de procede prenant en compte I'ambiguite du concept risque done de 
considerer un document pouvant interesser Tutilisateur comme ayant une mauvaise 
pertinence par rapport k ce concept, par exemple au cas ou une fausse detection 
d'ambiguite adviendrait. 

30 L'invention a pour but de remedier a cet inconvenient en fournissant un procede 

d'estimation de la pertinence d'un document par rapport a un concept capable de prendre 
en compte I'ambiguite du concept sans degrader I'estimation de la pertinence du 
document par rapport au concept. 

A cet effet, l'invention a pour objet un procede d'estimation de la pertinence d'un 

35 document par rapport k un concept, comprenant le calcul d'une fonction de pertinence du 
concept par rapport k ce document s'appuyant sur la connaissance d'un voisinage 



DOC (2).max 



WO 2005/010774 



PCT/FR2004/001930 



-2- 

semantique predetermine de ce concept, caracterise en ce qu'il comporte en outre le 
calcul d'une fonction d'ambigui'te de ce concept dans ce document, distincte de la fonction 
de pertinence, ce calcul etant estime a partir de la presence dans le document de 
differents sens de ce concept. 
5 Ainsi, la prise en compte de f'ambigufte est decorrelee du calcul de la fonction de 

pertinence. La pertinence du document reste done inchangee en cas d'ambiguite, et e'est 
un score determinant uniquement I'ambiguite qui avertit Putilisateur du fait que le 
document est susceptible de I'interesser ou non. 

Dans le cas d'une fausse detection d'ambiguTte, le document sera toujours 
10 consider^ comme pertinent par rapport au concept, puisqueseul le score determinant 
I'ambiguite est susceptible d'etre errone. 

Un procede selon Pinvention peut en outre comporter Tune ou plusieurs des 
caracteristiques suivantes : 

la fonction de pertinence mesure la presence du concept et des concepts du 
1 5 voisinage semantique de ce concept dans le document ; 

le voisinage semantique du concept comporte plusieurs nuages semantiques 
de sens distincts, et la fonction d'ambigurte compare la presence de 
concepts appartenant a un nuage semantique correspondant a un sens 
predetermine du concept avec la presence de concepts appartenant a des 
20 nuages semantiques differents ; 

la presence de cbacun des concepts appartenant aux differents nuages 
semantiques est ponderee par un coefficient predetermine ; 
le procede comporte une etape prealable de detection de concepts ambigus, 
e'est a dire da concepts comportant plusieurs nuages semantiques de sens 
25 differents dans leur meme voisinage semantique ; 

lors de I'etape de detection prealable, deux concepts sont consideres 
comme ambigus s'ils sont relies entre eux par au moins deux liens 
semantiques differents. 

lors de I'etape de detection prealable, un concept est consid&e comme 
30 ambigu s'il est relie k au moins deux nuages semantiques de sens 

differents ; 

le concept appartient k une base de connaissance obtenue par fusion d'une 
premiere base de connaissances avec une seconde base de connaissances, 
I'etape prealable de detection des concepts ambigus etant realisee lors de la 
35 fusion. 
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lors de rttape de detection des concepts ambigus, un concept de la 
premiere base de connaissances est considtrt comme ambigu s'il est relie 
par un nouveau lien a un autre concept de la premiere base de 
connaissances. 

5 - lors de Tetape de detection des concepts ambigus, un concept de la 

premiere base de connaissances est consider^ comme ambigu s'il est relit k 

au moins un nuage stmantique de la seconde base de connaissances. 

On notera qu'on appelle nuage stmantique d'un concept consider^, un ensemble 

constitut de concepts relies k un meme sens du concept considtre. 

10 Par exemple, le concept « Orange » comporte dans son voisinage semantique au 

moins deux nuages semantiques de sens differents, a savoir un nuage semantique se 

rapportant k la couleur orange (comportant entre autres les concepts «couleur», 

«jaune», « rouge », etc.) et le nuage semantique se rapportant au fruit orange 

§ 

(comportant entre autres les concepts « fruit », « agrume », « citron », etc. ). 
15 L'invention sera mieux comprise k la lecture de la description qui va suivre, donnte 

uniquement a titre d'exemple et faite en se referant aux dessins annexes dans lesquels : 
la figure 1 represente schematiquement une base de connaissances 
constitute de concepts et de liens semantiques entre eux ; 
les figures 2 et 3 represented schematiquement une methode de detection 
20 de concepts ambigus, mise en oeuvre dans un procedt seion l'invention et ; 

la figure 4 represente schematiquement un precede d'estimation de la 
pertinence d'un document par rapport k un concept selon l'invention. 
On a represente schematiquement sur la figure 1 une base de connaissances que 
Ton dtsignera par la reference gtntrale 10. 
25 On notera que, dans cet exemple, la base de connaissances 1 0 est constitute d'une 

base de connaissances 10A a laquelle on a ajoute une base de connaissances 10B, 
selon un procede de fusion de bases de connaissances connu en soit. 

Un concept 12 de la base de connaissances 10 est relit k d'autres concepts par des 
liens semantiques 14. 

30 L'ensemble des concepts ainsi relies au concept 12 forme un voisinage semantique 

de ce concept 12. Ce voisinage semantique peut comporter plusleurs nuages 
semantiques 16 de sens distincts, un nuage stmantique 16 du voisinage du concept 12 
etant, comme cela a ett defini precedemment, un ensemble constitue de concepts relics 
a un meme sens du concept 12 considere. 

35 Lorsqu'un concept 12 est relit a plusieurs nuages semantiques 16 de sens distincts, 

ce concept est dit « ambigu ». Les concepts ambigus sont designes sur fa figure 1 par la 
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reference generate 18, et par les references particulifcres 18A, 18B et 18C, ces references 
particuliferes correspondant a differents modes de detection des concepts ambigus, mis 
en oeuvre lors d'une etape prealabie d'analyse de la base de connaissances 10. Gette 
6tapo eera detailtee en reference aux figures 2 et 3. 
5 Durant cette etape prealabie, les concepts possedant plusieurs nuages semantiques 

de sens differents dans leur voisinage semantique sont marques comme etant ambigus. 

La figure 2 represente une mise en oeuvre de cette etape prealabie, adaptee pour la 
detection de concepts ambigus dans une base de connaissances donnee, par exemple 
ici, la base de connaissances 10A. 
10 Chaque concept 12 de la base de connaissances 10A est analyst lors d'une etape 

20 durant laquelle on recherche au moins deux liens semantiques differents reliant ce 
concept 12 k un seul autre concept. 

Dans le cas ou ces liens existent, on passe k une etape 21 au cours de laquelle le 
concept est marque comme etant un concept ambigu 18A, puisque la presence d'au 
1 5 moins deux Uens vers un meme autre concept indique une 1orte probabtlite pour que ces 
liens concernent des sens differents de ce concept. 

Dans le cas contraire, on passe a une etape 22 lors de laquelle on recherche au 
moins deux liens semantiques reliant ce concept 12 k deux nuages semantiques de sens 
differents. 

20 Dans le cas ou ces liens existent, le concept est par definition un concept ambigu. 

On passe alors k une etape 23 lors de laquelle il est marque comme etant un concept 
ambigu 18B. 

Dans le cas contraire, le concept 12 n'est pas considere comme etant ambigu, et on 
passe k une etape 24 de fin tfetape prealabie d'analyse de la base de connaissances 
25 10A. 

La figure 3 represente une mise en oeuvre de retape prealabie de detection des 
concepts ambigus, plus particulierement lors de la fusion de la base de connaissances 
10A avec la base de connaissances 10B. Les nouveaux liens crees entre concepts lors 
de cette fusion sont represenfes sur (a figure en traits interrompus. 

30 Chaque concept 12 existant dans la base de connaissance 10A est alors analyse 

lors d'une etape 25 durant laquelle on recherche au moins un nouveau lien semantique 
reliant ce concept 12 a un autre concept existant de la base de connaissance 10A, ce 
nouveau lien ayant ete cree lors de la fusion des deux bases 10A et 10B. 

Dans le cas ou un tel nouveau lien extste, on passe k une etape 26, durant laquelle 

35 le concept est marque comme etant un concept ambigu 18C, puisque la relation entre ces 
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deux concepts n'6tait pas prevue dans la base de connaissances initiale 10A, ce qui 
implique qu'il s'agit potentiellement d'homonymes. 

Dans le cas contraire, on passe a une etape 27, durant laquelle chaque concept 12 
existant dans la base de connaissance 10A est de nouveau analyst, pour rechercher au 
5 moins un lien semantique reliant ce concept 12 d un nuage de nouveaux concepts de la 
base de connaissances 10B. 

Dans le cas ou un tel lien existe, on passe a une etape 28 durant laquelle le concept 
est marqu6 comme Stant un concept ambigu 18D, puisqu'il est probable que ce lien vers 
ces nouveaux concepts concerne un homonyme. 
10 Dans le cas contraire, le concept 12 n'est pas considere comme Stant ambigu, et on 

passe & une 6tape 29 de fin d'etape prealable d'analyse de la base de connaissances. 

Une fois cette 6tape prealable de recherche de concepts ambigus effectu^e, il est 
possible d'esttmer la pertinence d'un document par rapport & un concept donne de la 
base de connaissances 10, par le proc&je represents schSmatiquement sur la figure 4. 
15 Lors d'une premiere 6tape 30, une requete d'estimation de la pertinence d'un 

document par rapport a un concept 12 de la base de connaissances 10 est emise, par 
exemple par un moteur de recherche. 

Une fois cette requete emise, on passe & une etape 32, durant laquelle un calcul 
d'une fonction de pertinence du document par rapport au concept 12 est effectuS de 
20 manure connue en soi. Cette fonction de pertinence est calculee en prenant en compte la 
presence dans le document du concept 12 et de concepts appartenant au voisinage 
semantique de cc concept 12. 

Ainsi, par exemple, la fonction de pertinence est donnee par liquation suivante : 

Pertinence(Doc. 12) = f[Presence(Doc. 12), coef x Pr6sence(Doc. voisinage(12))]. 
25 ou : 

Pertinence(Doc, 12) est la fonction de pertinence du concept 12 dans le 
document considere ; 

Presence(Doc, 12) est une fonction quantifiant la presence du concept 12 
dans le document consider^, par exemple, le nombre de fois ou le concept 
30 12 apparait dans le document ; 

Presence(Doc, vovs\nage(12)) est une fonction quantiftant \a presence dans 
le document considere de concepts appartenant au voisinage du concept 
12; 

coef est un coefficient de ponderation predetermine, permettant de 
35 d'accorder plus ou moins d'importance aux concepts appartenant au 

voisinage s§mantique du concept 12 ; 
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f est par exemple une fonction « maximum », ou une fonction « somme ». 
En fonction du resultat obtenu par ce calcul, le document peut etre consider^ 
comme etant pertinent vis k vis du concept 12, par exemple si ie calcul donne un resultat 
superieur a un seuil predetermine. Dans ce cas, on passe a une etape 34 au cours de 
5 laquelle le document est marque comme etant pertinent par rapport au concept 12. 

Dans le cas contraire, ou le resultat du calcul donne un resultat inferieur au seuil 
predetermine, on passe a une etape 36 au cours de laquelle le document est marque 
comme n'etant pas pertinent par rapport au concept 12. Dans ce cas, le document non 
pertinent n'est pas retenu. 
10 Dans le cas ou le document est marqu6 comme etant pertinent, le procede selon 

Invention prevoit ensuite le calcul d'une fonction d'ambiguite du concept dans le 
document. 

Lors d'une etape 38, on verifie si le concept 12 sur lequel porte la requSte est 
marque comme etant ambigu ou non dans la base de connaissances 10. 
15 S'il n'est pas marque comme etant ambigu, on passe a une etape 40 au cours de 

laquelle le document est marque comme etant pertinent et non ambigu. 

Si le concept 12 est marque comme etant ambigu, on passe & une etape 42 durant 
laquelle on procede a un calcul de la fonction d'ambiguite, comparant la presence de 
concepts appartenant k un nuage semantique correspondant & un sens predetermine du 
20 concept 12 (le sens du concept dans la requete) avec la presence de concepts 
appartenant a des nuages semantiques differents. 

Ainsi, la fonction d'ambiguite peut etre donncc par I'equation suivante : 
Ambiguite(Doc, 12) = f[coef1 x Presence(Doc, nuagel), coef2 x Presence(Doc, 
nuage2)], 
25 ou : 

AmbiguTte(Doc, 12) est ia fonction d'ambiguite du concept 12 dans le 
document consider ; 

nuagel et nuage2 sont deux nuages semantiques differents relies au 
concept 12 consider ; 

30 - Presence(Doc, nuagel) quantifie la presence de concepts appartenant au 

nuage 1 dans le document consider ; 

coefl est un coefficient predetermine, permettant d'accorder plus ou moins 
cfimportance aux concepts appartenant au nuage 1 ; 
Presence(Doc, nuage2) quantifie la presence de concepts appartenant au 
35 nuage 2 dans le document consider ; 
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coef2 est un coefficient predetermine, permettant d'accorder plus ou moins 
d'importance aux concepts appartenant au nuage 2 ; 
f est une fonction de comparaison. 
Une fois ce score d'ambiguite calculi, on passe a une etape 44 au cours de laquelle 
5 le document, est marque comme pertinent avec un score d'ambiguite, et ii ne tient ainsi 
qu'a I'utilisateur d'estimer, a I'aide de ce score d'ambiguite, si le document est susceptible 
de I'interesser ou non. 

II apparatt clairement qu'un procede d'estimation de la pertinence d'un document 
par rapport a un concept donne, tei que decrit pr^cedemment, fournit de meilleurs 
10 resultats que les proc6des existants, en ponderant la pertinence par un calcul d'ambiguite 
sans affecter I'estimation de la pertinence elle-meme. 
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REVENDICATiONS 

1. Procede d'estimation de la pertinence d'un document par rapport k un concept 
(12), comprenant le calcul (32) d'une fonction de pertinence du concept (12) par rapport a 

5 ce document s'appuyant sur la connaissance d'un voisinage semantique predetermine de 
ce concept (12), caracterise en ce que, si le document est consider comme pertinent: 

- On calcule (42) une fonction d'ambiguite de ce concept (12) dans ce document, 
distincte de la fonction de pertinence, ce calcul etant estime & partir de la presence dans 
le document de differents sens de ce concept, et 
10 - On associe (44) un score d'ambiguTte au document consider^ comme pertinent. 

2. Procede d'estimation de la pertinence d'un document par rapport a un concept 
(12) seion la revendication 1 , dans lequel la fonction de pertinence mesure la presence du 
concept (12) et des concepts du voisinage semantique (16) de ce concept (12) dans le 
document. 

15 3. Procede d'estimation de fa pertinence d'un document par rapport a un concept 

(12) selon la revendication 1 ou 2, dans lequel, le voisinage semantique de ce concept 
(12) comportant plusieurs nuages semantiques (16) de sens distincts, la fonction 
d'ambiguite compare la presence de concepts (12) appartenant k un nuage semantique 
(16) correspondant k un sens predetermine du concept (12) avec la presence de 

20 concepts appartenant k des nuages semantiques (16) differents. 

4. Procede d'estimation de la pertinence d'un document par rapport a un concept 
(12) selon la revendication 3, dans lequel fa presence de chacun des concepts 
appartenant aux differents nuages semantiques (16) est pond6ree par un coefficient 
predetermine. 

25 5. Procede d'estimation de la pertinence d'un document par rapport k un concept 

(12) selon Tune quelconque des revendications 1 a 4, comportant une etape prealable de 
detection de concepts ambigus (18), c'est a dire de concepts comportant plusieurs 
nuages semantiques (16) de sens differents dans leur meme voisinage semantique. 

6. Procede d'estimation de la pertinence d'un document par rapport a un concept 

30 (12) selon la revendication 5, dans lequel, lors de retape de detection prealable, deux 
concepts sont considers comme ambigus (18A) s'lls sont relies entre eux par au molns 
deux liens semantiques (14) differents. 

7. Proccdd d'estimation do la pertinence d'un document par rapport a un concept 
(12) selon la revendication 5 ou 6, dans lequel, lors de retape de detection prealable, un 

35 concept est consider comme ambigu (18B) s'il est relie a au moins deux nuages 
semantiques (16) de sens differents. 
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8. Proc6d6 cTestimation de la pertinence d'un document par rapport k un concept 
(12) selon Tune quelconque des revendications 5 & 7, dans lequel, le concept (12) 
appartenant a une base de connaissance (10) obtenue par fusion d'une premiere base de 
connaissances (10A) avec une seconde base de connaissances (10B). I*6tape prealable 

5 de detection des concepts ambigus est r£alis6e lors de Ea fusion. 

9. Proc^de d'estimation de la pertinence d'un document par rapport a un concept 
(12) selon la revendication 8, dans lequel, lors de I'&ape de detection des concepts 
ambigus, un concept de la premiere base de connaissances (10A) est considers comme 
ambigu (18C) s'il est relie par un nouveau lien & un autre concept de la premiere base de 

1 0 connaissances ( 1 0 A) . ' 

10. Procede ^estimation de la pertinence d'un document par rapport & un concept 
(12) selon la revendication 8 ou 9, dans lequel, lors de 1'6tape de detection des concepts 
ambigus, un concept de la premiere base de connaissances (10A) est considere comme 
ambigu (18C) s'il est relie a au moins un nuage semantique de la seconde base de 

1 5 connaissances ( 1 0B) . 
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